查看原文
其他

CVPR2019最佳论文解读

Jackpop 平凡而诗意 2022-06-20
点击蓝色字关注我们!

CVPR,全称IEEE Conference on Computer Vision and Pattern Recognition,与ECCV ( Europeon Conference on Computer Vision),ICCV ( IEEE International Conference on Computer Vision)并称为计算机视觉领域三大会议,均为计算机视觉领域的顶级会议。由于近几年计算机视觉的异常火热,CVPR也就成为很多计算机视觉领域研究者趋之若鹜的盛宴,它的受关注程度更是今非昔比。本文就来介绍一下前不久获得CVPR2019最佳论文奖的作品。

前言

CVPR2019于2019年6月16日在美国召开,此次会议共收到来自全球14104位研究者提交的5160篇文章,同比2018年增长56%,一举打破记录,受欢迎程度可见一斑。

CVPR2019最终共接收1294篇文章,尽管CVPR被计算机视觉领域视为顶尖,我个人认为,其中不乏质量平平的水文,真正令人印象深刻、几年之后依然被人所熟知且实用,且在算法思想方面取得跨越的却寥寥无几。闲话说完,回到本文的重点CVPR2019最佳论文,该荣誉最终由卡耐基梅隆大学、多伦多大学、伦敦大学学院的多位研究者斩获,论文名称为A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction,这篇文章不仅跳出多年来一直火热的目标检测圈子,而且在理论推导和证明方面做了很多工作,因此,获得CVPR2019最佳论文奖也是实至名归。接下来,我详细解读一下这篇文章。

论文链接:

http://openaccess.thecvf.com/content_CVPR_2019/papers/Xin_A_Theory_of_Fermat_Paths_for_Non-Line-Of-Sight_Shape_Reconstruction_CVPR_2019_paper.pdf

数学符号含义

   光源上的点

  可见场景内的点

   隐藏物体表面的点

   检测器上的点

  费马路径长度

  瞬态

概念解释

瞬态(transients):一种测量值,用于重建隐藏形状信息的大多数方法采用快速调制光源已经传感器来记录光子强度和旅行时间的测量值。
费马路径(Fermat paths):首先返回的光子路径的超集合。
费马路径长度(Fermat pathlengths):顾名思义,就是通过光速等计算出来的离散路径长度。

概述

本文提出一种新的费马光路理论(Fermat paths),即在可见场景和不处于瞬态视线范围内的一个未知物体之间的光路。这些光路要么服从镜面反射,要么被物体的边界反射,从而能够编码隐藏物体的状态。

本文证明了费马路径对应于瞬态测量中的不连续性,然后推导出一种新的约束,它将这些不连续处路径长度的空间导数与表面法向联系起来。基于这一理论,本文提出一种非视线物体形状估计算法,成为费马流算法(Fermat Flow)。本方法使得能够精确回复复杂物体的形状,从漫反射到镜面反射,这些物体隐藏在角落里,也隐藏在漫反射后面。

简单的描述本文提出的算法:能够重建非视线范围内的物体形状,能够看到角落里的物体。

算法解析


目前大多数计算机视觉领域的研究都是围绕着视觉可见范围内的研究,但是理解视野范围之外的场景在很多领域却有着非常重要的应用,因此,这使得这项研究更加具有价值。

被动方式通过分析隐藏场景所投射的阴影来粗略估计物体的运动和结构,或者利用光的相干性来定位隐藏对象。这些方法没有足够的信息来精确计算位置隐藏场景的三维形状。主动方式提取隐藏场景的附加信息时可能的。大多数重建隐藏形状信息的方法都是用调制光源和时间分辨传感器、超快光电二极管等,这些传感器不仅记录入射光子的强度,还在时间分辨率范围内记录它们到达的时间,这种测量称为瞬态。

大多数主动技术都是通过测量一个已知可见场景的不同位置的瞬态,然后根据已经获取的辐射成像逆向来进行三维重建,例如椭圆反投影、正则化线性系统、光锥变换等。这些方法主要有两个缺点:

  • 它们依赖于辐射测量信息

  • 为了简化反演问题,所有现有的重建技术都依赖于非视线场景的Lambertian 反射假设

在这篇文章中,作者提出一种使用视线以外场景的瞬态测量得到的几何信息的方法,克服了上述的限制。简言之,它主要使用视线内和视线外场景之间的一种称之为费马路径的几何路径星系,通过观察发现这些路径遵循镜面或者物体边界特点的反射定理。作者证明,费马路径对应于瞬态测量中的不连续性,不连续点的时间位置仅是视线外场景对象的形状而不是其反射率。

利用上述理论,推导出一种精确重建视线外物体形状的算法,称之为费马流(Fermat Flow)。作者证明,费马路径长度的空间导数提供了一个简单的约束,它唯一地决定了隐藏场景点的深度和法线。这个导数是通过将光滑的路径函数拟合到一组稀疏的测量值上而得到,然后结合深度和法线信息来计算平滑网格。

概括一下,本文在隐藏物体重建方面主要包含以下3个步骤:

  • 瞬态测量

  • 求解费马流方程

  • 表面拟合

瞬态测量

假设已经校准了从光源到可见点,和从可见点到检测器的距离

那么可以通过光速等计算在非可见场景的路径长度,


其中是非可见物体表面的参数化表示。

费马流方程

给定测量的瞬态,可以把它的离散性定义为对费马路径长度的贡献,每个路径长度约束了球面上的点的法线和曲率。这是本文的核心所在,给定一组费马路径长度,就可以得到隐藏物体表面点集的位置和法线。

首先定义费马路径函数,


在每个瞬态可以有多个不连续的路径长度,因此费马路径函数是一个多值函数

其中是隐藏物体球面上的点,因此,物体可以唯一的被可见v、路径长度、梯度重建,得到隐藏物体表面的点,然后通过一些简单的集合操作即可。

但是就算路径长度的导数是一件非常难的事情,它和选取的可视面的形状、位置有密切的关系,为了简化,文中采用选取平面作为可视区域,得到的导数为,

表面拟合


上述的步骤生成了一系列的有向点云,它的密度相当于在可视区域上的测量密度,然后,可以使用算法,利用正常信息,以更高的精度将曲面表示(如三角形网格)匹配到点云,给定这样一个初始的表面重建,在补充中,我们描述了一个基于高光路径扰动理论的优化过程,该过程对拟合表面进行了细化,以考虑由于梯度估计不准确而可能产生的误差。

实验结果

如图中所示,分别从两个视图中重建了一个有方向的点云,点按它们的法线着色。最后,我们将一个表面与点云相匹配,显示在右边的两个视图下。

扫描的对象跨越各种形状(凸,凹)和反射(半透明,光泽,镜面)。对于每一个物体,我们展示了环境光下的照片,以及它表面重建的两个视图。


有趣的灵魂在等你

长按扫码可关注


相关文章学习资源:算法从入门到精通Python网页爬虫入门指导这是一个令人惊叹的综合工具网站一文配置全面而强大的vim
文章好看就点这里

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存